(g) BUNDESREPUBLIK <§) P3t©ntSChl*if t 

DEUTSCHLAND @ Q£ 41 06 405 C2 



@ Aktenzeichen: P 41 08 405.4-53 

® Anmeldetag: 28. 2.91 

® Offenlegungstag: 28. 9.91 

(§) Veroffentlichungstag 

der Patenterteltung: 29. 2.98 




DEUTSCHES 
PATEIMTAMT 



<|j) Int. C!. 6 : 

G 10 L 3/00 

H04B 15/00 
B 60 R 27/00 



C4 
O 

CD 



Innerhalb von 3 Monaten nach Veroffentlichung der Erteilung kann Elnspruch erhoben warden 



UJ 

Q 



®Unionspriorltat: @ <§> ® 

23.03.90 JP 2-74889 23.03.90 JP 2-74690 

{§) Patentinhaber: 

Ricoh Co., Ltd., Tokio/Tokyo, JP 

© Vertreter: 

Schwabe, H., Dipl.-lng.; Sandmair, K., Dipl.-Chem. 
Dr.jur. Dr.rer.nat.; Marx r L, Dipl.-Phys. Dr.rer.nat., 
Pat.-Anwilte, 81677 Munchen 

® Erfinder: 

Ariyoshi, Takashi, Yokohama, Kanagawa, JP; 
Fujimoto, Junichiroh, Yokohama, Kanagawa, JP 



Fur die Beurteilung der Patentfahigkeit 
in Betracht gezogene Oruckschriften: 

DE 39 25 589 A1 

BOLU, S.F.: Suppression of Acoustic Noise in 
Speech Using Spectral Subtraction. In: IEEE 
Transactions on Acoustics, Speech, and Signal 
Processing, Vol. ASSP-27, Nr. 2, April 1979, 
S. 113-120; 

WIDROW, B. et al: Adaptive Noise Cancelling: 
Principles and Applications. In: Proceedings of the 
IEEE, Vol. 63, Nr .12, Dez. 1975, S.1682-1716; 
FUJIMOTO, J., NAKATAN1, T., YONEYAMA, M.: 
Speaker-Independent Word Recognition Using 
Fuzzy Pattern Matching. In: Fuzzy Sets and 
Systems 32 (1989) North-Holland, S. 181-191; 



© Gerauschunterdruckungseinrichtung fur ein Sprache rkennurg system 



CM 

o 

CO 



HI 

Q 



GerSuschunterdruckungseinrichtung fur ein Spracherken- 
nungssystem, in welchem eine Sprache eines Sprechers, 
welche einem Mikrophon (1) zugefuhrt worden tst, erkannt 
warden kann, woboi das Mikrophon in einem Raum vorgese- 
hen ist, in dem sich ein Lautsprecher (2) befindet, welcher 
einen Klang abgibt, der einem wlederzugebenden Signal 
entspricht. welches von einer Audio-Einheit zugefuhrt wird, 
mit einer ersten Kennzeichen-Extrahiereinheit (10). um erste 
Kennzeichendaten aus einem elektrischen Signal zu extra - 
hieren, das von dem Mikrophon (1) abgegeben worden ist, 
wobei die ersten Kennzeichendaten ein Kennzeichen des 
elektrischen Signals darstellen; mit einer zweiten Kennzei- 
chen-Extrahiereinheit (20), um zweite Kennzeichendaten aus 
dem wiederzugebenden Signal zu extra hieren, welches dem 
Lautsprecher (2) zugefuhrt werden soil, wobei die zweiten 
Kennzeichendaten ein Kennzeichen des wiederzugebenden 
Signals darstellen, mit einer ersten Gerauschkomponenten 
erzeugenden Einheit, welche mit der zweiten Kennzeichen- 
Extrahiereinheit (20) verbunden 1st um Gerauschdaten, 
welche auf den zweiten Kennzeichendaten von der zweiten 
Kennzeichen-Extrahiereinheit (20) beruhen, zu erzeugen. 
wobei die Gerauschdaten einen Klang darstellen, welcher 
sich von dem Lautsprecher (2) durch den Raum zu dem 
Mikrophon (1) fortpflanzt, und mit einer ersten Gerausche- 
Subtrahiereinheit (30), welche mit der ersten Kennzeichen- 
Extrahiereinheit (10) und der ersten Gerauschkomponenten 
erzeugenden Einheit verbunden ist, um die Gerauschdaten, 
weiche von der ersten Gerauschkomponenten erzeugenden 
Einheit zugefuhrt worden sind, von den ersten Kennzeichen- 
daten zu subtrahieren, die von der ersten Kennzeichen-Ex- 
trahiereinheit (10) zugefuhrt worden sind. und um erste 
Sprachdaten abzugeben, so daB die ersten Sprachdaten 
verwendet werden, um die Sprache des Sprechers zu 
erkennen, dadurch gekennzeichnet, daS ein Speicher (28) 
zum Speichern von Ubertragungskenndaten vorgesehen ist 
welche einen Zustand darstellen, unter welchem sich ein 
Klang von dem Lautsprecher (2) zu dem Mikrophon (1) ... 
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Beschreibung 

Die Erfindung betrifft eine GeraiischunterdrOckungs- 
einrichtung fOr ein Spracherkennungssystem nach dem 
Oberbegriff des Ansp ruches 1. 5 

Eine derartige Gerauschimterdruckungseinrichtung 
fQr ein Spracherkennungssystem ist aus der DE 
39 25 589 Al bekannt. Diese bekannte Gerfiuschunter- 
druckungseinrichtung umfaBt ein Mikrophon, welches 
zusamroen mit wenigstens einem Lautsprecher in einem >o 
Raum aufgestellt ist, wobei der Lautsprecher einen 
KJang abgibt, der einem wiederzugebenden Signal ent- 
spricht, wetches von einer Audio- Einheit zugefdhrt wur- 
de. Es ist ferner eine erste Kennzeichen-Extrahierein- 
heit vorhanden, urn erste Kennzeichendaten aus einem 15 
elektrischen Signal zu extrahieren, das von dem Mikro- 
phon abgegeben worden ist, wobei die ersten Kennzei- 
chendaten ein Kennzeichen des elektrischen Signals 
darstellen. Ferner ist eine zweite Kennzeichen-Extra- 
biereinheit vorhanden, urn zweite Kennzeichendaten 20 
aus dem wiederzugebenden Signal zu extrahieren, wel- 
ches dem Lautsprecher zugefuhrt werden soli, wobei die 
zweiten Kennzeichendaten ein Kennzeichen des wie- 
derzugebenden Signals darstellen. Die zweite Kennzei- 
chen-Extrahiereinheit ist mit einer ersten Gerausch- 25 
komponenten erzeugenden Einheit verbunden, urn Ge- 
rauschdaten, welche auf den zweiten Kennzeichendaten 
von der zweiten Kennzeichen-Extrahiereinheit beru- 
hen, zu erzeugen, wobei die Gerauschdaten einen KJang 
darstellen, welcher sich von dem Lautsprecher durch so 
den Raum bis zu dem Mikrophon fortpflanzt. Mit der 
ersten Kennzeichen-Extrahiereinheit ist eine erste Ge- 
rausche-Subtrahiereinheit verbunden, welche auch mit 
der ersten Gerauschkomponenten erzeugenden Einheit 
verbunden ist, so daB Gerauschdaten, die von der ersten 35 
Gerauschkomponenten erzeugenden Einheit abgege- 
ben werden, von den ersten Kennzeichendaten subtra- 
hiert werden kdnnen, die von der ersten Kennzeichen- 
Extrahiereinheit zugefdhrt worden sind. Es lassen sich 
damit erste Sprachdaten erzeugen, die dazu verwendet 40 
werden kdnnen, um die Sprache des Sprechers zu er- 
kennen. 

Es ist auch das Eingeben von Informationen in eine 
Maschine mit Hilfe der Sprache bekannt geworden (sie- 
he S. F. Boll: Suppression of Acoustic Noise in Speech +5 
Using Spectral Subtraction. In: IEEE Transactions on 
Acoustics, Speech and Signal Processing, VoL ASSP-27, 
Nr. 2, April 1979, Seiten 113 bis 120, sowie B. Widrow et 
al.: Adaptive Noise Cancelling: Principles and Applica- 
tions. In: Proceedings of the IEEE, VoL 63, Nr. 12, Dez. 50 
1975, Seiten 1692 bis 1716). Das heiBt, es ist ein Sprech- 
erkennungssystem vorgeschlagen worden, welches bei 
einer Steuereinheit verwendet werden kann, um eine 
Audioeinheit, einen Luft-Conditioner bzw. eine Kli- 
maanlage, ein Navigationssystem u. a. zu steuern, wel- 55 
che in einem Fahrzeug vorgesehen sind. In dem Fahr- 
zeug beeinflussen verschiedene Arten von Gerauschen 
im Fahrzeuginneren das Spracherkennungssystem, 
wenn das Fahrzeug fahrt, und Klange von in dem Fahr- 
zeug vorgesehenen Audio- Einhei ten wirken auf das *° 
Spracherkennungssystem, wie Gerausche im Fahrzeug- 
inneren, Folglich muB in dem im Fahrzeug vorgesehe- 
nen Spracherkennungssystem eine Gerauschunterdrflk- 
kungseinrichtung vorgesehen werden, um die verschie- 
denen Arten von Gerauschen im Fahrzeuginneren zu 65 
iinterdrucken. 

Beispiele von herkdmmlicher Spracherkennung sind 
die "Spektrale Subtrakionsmethode von S. F. Boll u. a." 
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und eine "Adaptive Gerauschunterdruckungsmethode 
von B. Window u. a." 

In der "spektralen Subtraktionsmethode* wird ein 
Spektrum des Gerausches unter einer Bedingung abge- 
tastet, bei welcher keine Sprache vorhanden ist, welche 
erkannt werden sollte, und dann wird das abgetastete 
Spektrum des Gerausches in einer Speichereinheit ge- 
speichert. Das abgetastete Spektrum des Gerausches in 
der Speichereinheit wird fortlaufend aktualisiert Wenn 
die Stimme eines Sprechers mit einem Mikrophon unter 
der Voraussetzung aufgenommen wird, daB es verschie- 
dene Arten von Gerauschen gibt, wird das Spektrum 
des in der Speichereinheit gespeicherten Gerausches 
von einem akustischen Spektrum subtrahiert, welches 
einem akustischen Signal entspricht, das fiber das Mi- 
krophon erhalten worden ist, so daB nur eine Stimmen- 
spektrumskomponente, welche der Stimme des Spre- 
chers entspricht, erhalten wird. 

In der vorerwahnten "spektralen Subtraktionsmetho- 
de" konnen, da das Gerauschspektrum laufend aktuali- 
siert wird, Hintergrundgerausche von dem akustischen 
Signal subtrahiert werden. Es ist jedoch schwierig, ein 
unregelmaBtges Gerausch, welches bezQglich der Zeit in 
unregelmafiiger Weise erzeugt wird, von dem akusti- 
schen Signal zu subtrahieren. Das unregelmaBige Ge- 
rausch enthalt den KJang, welcher von der Audio-Ein- 
heit, wie einem Radiogerat und einem Stereo- Bandrec- 
order, abgegeben worden ist. 

Bei der "adaptiven Geriiuschuntercu~ilckung$ met no- 
de" bei welcher beispielsweise zwei Mikro phone ver- 
wendet werden, ist ein erstes Mikrophon nahe bei dem 
Sprecher und ein zweites Mikrophon weit von dem 
Sprecher entfernt vorgesehen. Die Stimme des Spre- 
chers wird hauptsachlich von dem ersten Mikrophon 
aufgenommen. Verschiedene Arten von Gerauschen ge- 
langen in die beiden Mikrophone bzw. werden von die- 
sen aufgenommen. In diesem Fall wird ein Ger3uschsi- 
gnal, welches tiber das zweite Mikrophon erhalten wor- 
den ist, in einem adaptiven Filter verarbeitet, in wel- 
chem dessen Filtercharakteristik gesteuert werden 
kann. Das von dem adaptiven Filter abgegebene Signal 
wird von dem akustischen Signal subtrahiert, welches 
ttber das erste Mikrphon erhalten worden ist, so daB ein 
Stimmensignal, welches der Stimme des Sprechers ent- 
spricht, erhalten wird. Die Filtercharakteristik des vor- 
erwahnten adaptiven Filters wird so gesteuert, daB der 
Fehler (c) eines Ausgangssignals minimiert wird 

Bei der vorstehend erwahnten "adaptiven Gerausch- 
unterdruckungsmethode" mit zwei Mikrophonen ist ein 
Computer fQr eine aufwendige Berechnung erforder- 
lich, um die Filtercharakteristik des adaptiven Filters zu 
steuern. Daher werden die Kosten der Gerauschunter- 
druckungseinrichtung hoher. In einem Fall, bei welchem 
das Gerausch, welches beachtet werden sollte, auf den 
KJang von der Audio-Einheit beschrankt wird, ist die 
Gerauschunterdrilckungseinrichtung, die nach der vor- 
erwahnten "adaptiven GerauschunterdrQckungsmetho- 
de* arbeitet, fur den praktischen Gebrauch nicht gut 
AuBerdem ist es dann, wenn eine Vielzahl von Ge- 
rauschen zusammentrifft, schwierig, die Filtercharakte- 
ristik des vorerwahnten adaptiven Filters zu steuern, so 
daB keine richtige Rauschunterdruckung durchgeffihrt 
werden kann. 

Die der Erfindung zugrunde liegende Aufgabe be- 
steht darin, eine Ger^uschunterdrtickungseinrichtung 
ftir ein Spracherkennungssystem der angegebenen Gat- 
tung zu schaffen, welches die MSglichkeit bietet, auf 
schnelle Weise an gegebene Raumverhaltnisse ange- 
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paBt werden zu konnen, um aus einem zu erzeugenden 
akustischen Signal Gerausche wirksamer entfernen zu 
kdnnen. 

Diese Aufgabe wird erfindungsgeroaB durcfa die im 
Kennzeichnungsteil des Anspruches 1 aufgefflhrten 
Merkmale geldst 

Besonders vorteilhafte Ausgestaltungen und Weiter- 
bildungen der Erfmdung ergeben sich aus den Unteran- 
spruchen. }0 

Im folgenden wird die Erfindung anhand von bevor- 
zugten Ausfuhrungsbeispielert unter Hinweis auf die 
Zeichmingen naher erlautert Es zeigt: 

Fig. 1 ein Blockdiagramra eines Spracherkennungssy- 
stems mit einer Gerauschunterdriickungseinrichtiing 
gemaB einer ersten Ausfuhrungsform mit Merkmalen 
nach der Erfindung ; 

Fig. 2 ein Blockdiagramra einer Modifikation des in 
Fig. 1 dargestellten Spracherkennungssystems; 

Fig. 3 ein Blockdiagramm eines Spracherkennungssy- ^ 
stems mit einer Gerauschunteixiruckungseinrichtung 
gemaO einer zweiten AusfQhrungsform mit Merkmalen 
nach der Erfindung; 

Fig. 4 ein Blockdiagramm einer Modifikation des in 
Fig. 3 dargestellten Spracherkennungssystems ; 

Fig. 5 ein Diagramm, in welchem Detektoren zum 
Feststellen des Offnens und SchlieBens von Fahrzeugtu- 
ren dargestellt sind; und 

Fig. 6 ein Diagramm eines Detektors, um festzustel- 
len, wie oft ein Fahrzeug-Fenster gedf met wird. 3() 

Nunmehr wird eine erste Ausftihrungsform mit 
Merkmalen nach der Erfindung anhand von Kg. 1 be- 
schrieben. Das in Fig. 1 dargestellte Spracherkennungs- 
system ist beispielsweise in einem Fahrzeug vorgesehen. 
In Fig. I sind in dem Fahrzeug ein Mikrophon 1 und ein ^ 
Lautsprecher 2 vorgesehen. Ein Radiogerat, ein Stereo- 
GerSt, il a. welche in dem Fahrzeug vorgesehen sind, 
liefern wiederzugebende Signale an den Lautsprecher 2, 
und der Lautsprecher 2 setzt die wiederzugebenden Si- 
gnale in KJange um. Die Stimme eines Sprechers, die 
KJange aus dem Lautsprecher 2 und verschiedene Ge- 
rausche im Fahrzeuginneren werden von dem Mikro- 
phon I aufgenommen. Ein erste Kennzeichen-Extra- 
hiereinheit 10 holt Kennzeichen aus dem akustischen 
Signal heraus, welche Gerausche enthalten, wobei die 
akustischen Signale von dem Mikrophon 1 aus der er- 
sten Kennzeichen-Extrahiereinheit 10 zugefuhrt wer- 
den. Eine zweite Kennzeichen-Extrahiereinheit 20 holt 
Kennzeichen aus wiederzugebenden Signalen heraus, 
welche von jeder Audio-Einheit, wie dem Radiogerat 
und dem Stereo-Gerat geliefert worden sind. Eine erste 
Gerausche-Subtrahiereinheit 30 subtrahiert Gerausch- 
daten, welche von der zweiten Kennzeichen-Extrahier- 
einheit 20 erhalten worden sind, von Audio-Daten, wel- 
che von der ersten Kennzeichen-Extrahiereinheit 10 er- 
halten worden sind Eine SprachintervaU-Detektions- 
einheit 40 steilt Sprachintervalle, welche Intervalle fur 
Sprachen oder Stimmen sind, in einer Datenreihe fest, 
welche von der ersten Gerausche-Subtrahiereinheit 30 
zugefuhrt worden sind. Eine Gerausche-Vermutungs- ^ 
einheit 50 vermutet Nicht-Sprachen-Intervalle, welche 
Intervalle aufier dem Sprachintervall sind, in der Daten- 
reihe, welche von der ersten Gerausche-Subtrahierein- 
heit 30 geliefert werden. Eine zweite Gerausche-Subtra- 
hiereinheit €0 subtrahiert die Gerauschkomponente, ^ 
welche durch die Vermutungsoperation in der Ge- 
rausche-Vermutungseinheit 50 erhalten worden sind, 
von den Daten in den Sprachintervallen, welche durch 
die Sprachintervatl-Detektionseinheit 40 festgestellt 
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worden sind. Eine Eingangsmuster-Erzeugungseinheit 
70 erzeugt ein eingegebenes Sprachmuster der Stimme 
des Sprechers auf der Basis der Daten, welche von der 
zweiten Gerausche-Subtrahiereinheit 60 abgegeben 
worden sind. Eine Erkennungseinheit 90 vergleicht ver- 
schiedene Referenzmuster, welche in einem Referenz- 
musterspeicher 80 gespeichert sind und das eingegebe- 
ne Sprachmuster, das von der Eingangsmuster-Erzeu- 
gungseinheit 70 erzeugt worden ist, und gibt ein Erken- 
nungsergebnis ab, welches durch den vorstehenden 
Vergleich erhalten wird 

Nunmehr wird das in Fig. 1 dargestellte Spracherken- 
nungssystem im einzelnen beschrieben. Die erste Kenn- 
zeichen-Extrahiereinheit 10, welche die Merkmale oder 
Kennzeichen aus dem von dem Mikrophon zugefuhrten, 
akustischen Signal extrahiert, weist einen Verst&rker 11, 
eine Vorverzerrungsschaltung 12, eine BandpaB-Filter- 
bank 13, einen Multiplexer 14 und einen A/D-Umsetzer 
15 auf. Der Verstarker 11 hat eine vorherbestimmte 
Verstarkung und verstarkt das akustische, von dem Mi- 
krophon 1 zugefiihrte Signal. Die Vorverzerrerschal- 
tung 12 hebt Frequenzkomponenten in dem Hochfre- 
quenzband des von dem Verstarker 11 zugefuhrten, 
akustischen Signals an. Die BandpaB-Filterbank 13 hat 
fflnfzehn BandpaB-Filter. Die verschiedenen Frequenz- 
bander der funfzehn BandpaB-Filter unterscheiden sich 
voneinander. Funfzehn Frequenzen, welche auf einer 
Achse von logarithm ischen Koordinaten, welche von 
250 Hz bis 6,5 Khz reichen, in regelmaBigen Intervallen 
angeordnet sind, sind Mittenfrequenzen der Frequenz- 
bander der funfzehn BandpaB-Filter. Die BandpaB-Fil- 
terbank 13 hat auch Gleichrichter und HefpaBfilter, 
welche jeweils einem der Frequenzbander entsprechen. 
Mit Hilfe der BandpaB-F^lter, der Gleichrichter und der 
HefpaBfilter steilt die BandpaB-Filterbank 13 Spektren 
des von dem Mikrophon 1 aufgenommenen Klangs fest 
Der Multiplexer 14 wahlt eines der Spektren in den 
funfzehn Frequenzbandern aus, wobei die Spektren von 
der BandpaB-Filterbank 13 zugef tthrt werden. Der A/D- 
Umsetzer 15 setzt ein Spektrum in jedem Frequenz- 
band mit einer Abtastfrequenz von 10 ms in digitale 
Daten um Daher wird in der ersten Kennzeichen-Extra- 
hiereinheit 10 das Signal, welches den Verstarker 11, die 
Vorverzerrerschaltung 12, die BandpaB-Filterbank 13, 
den Multiplexer 14 und den A/D-Umsetzer 15 passiert 
hat, in ein zeitspektrales Muster X(t,f) umgesetzt, das 
Gerausche enthalt, wobei t eine Zeitkomponente und f 
eine Frequenzkomponente ist. 

Die zweite Kennzeichen-Extrahiereinheit 20 extra- 
hiert die Merkmale aus dem wiederzugebenden Signal, 
welches durch den Lautsprecher 2 in den Klang umge- 
setzt werden soil. Der Klang aus dem Lautsprecher 2 
wird als Gerausch dem Mikrophon 1 zugefuhrt Die 
zweite Kennzeichen-Extrahiereinheit 20 weist eine Vor- 
verzerrerschaltung 22, eine BandpaB-Filterbank 23, ei- 
nen Multiplexer 24 und einen A/D-Umsetzer 25 auf. Die 
Vorverzerrerschaltung 22 hebt die Frequenzkompo- 
nenten in dem hochfrequenten Band des wiederzuge- 
benden Signals an, das von den Audio-Einheiten zuge- 
fuhrt worden ist Die BandpaB-Filterbank 23 ermittelt 
Spektren des wiederzugebenden Signals in derselben 
Weise wie die BandpaB-Filterbank 13 der ersten Kenn- 
zeichen-Extrahiereinheit 10. Der Multiplexer 24 wahlt 
eines der von der BandpaB-Filterbank 23 gelieferten 
Spektren aus. Der A/D-Umsetzer 25 setzt ein Spektrum 
in jedem Frequenzband, wobei das Spektrum von dem 
Multiplexer 24 zugefuhrt wird, in digitale Daten um. In 
der zweiten Kennzeichen-Extrahiereinheit 20 wird das 
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wiederzugebende Signal, welches die Vorverzerrer- 
schaltung 12, die BandpaB-FiIterbank 23, den Multiple- 
xer 24 und den A/D-Umsetzer 25 passiert hat, in ein 
zeitspektrales Muster N(tf) des wiederzugebenden Si- 
gnals umgesetzt, das dem Lautsprecher 2 zugeftihrt 
werden solL 

Eine Obertragungsfunktion H(f) zwischen dem Laut- 
sprecher 2 und dem Mikrophon 1 ist vorher in einem 
Ubertragungsfunktions-Speicher 28 gespeichert wor- 
den. Die Obertragungsfunktion H(f) zeigt eine Voraus- 
setzung an, bei welcher der von dem Lautsprecher 2 
abgegebene KJang sich zu dem Mikrophon 1 hin aus- 
breitet Das beiBt, die Obertragungsfunktion H(f) zeigt 
eine Beziehung zwischen einem von dem Lautsprecher 
2 abgegebenen KJang und einem an dem Mikrophon 1 
ankommenden KJang an und verandert sie auf der Basis 
eines Zustands des Raums, welcher den Lautsprecher 2 
und das Mikrophon 1 umgibt Die Obertragungsfunk- 
tion H(f) kann experimenteU erhalten werden. Wenn 
beispielsweise ein pulsfdrmiges Signal durch den Laut- 20 
sprecher 2 in einen KJang umgewandelt wird, wird ein 
durch das Mikrophon 1 erhaltener Impuls-Frequenzbe- 
reich entsprechend einer Fourier-Transformation ver- 
arbeitet Hierdurch wird die Obertragungsfunktion H(f) 
zwischen dem Lautsprecher 2 und dem Mikrophon 1 25 
erhalten. Die Obertragungsfunktion H(f) zwischen dem 
Lautsprecher 2 und dem Mikrophon 1 kann auch auf der 
Basis eines Frequenzbereichs des Mikrophons 1 erhal- 
ten werden, wenn der Lautsprecher 2 ein weiBes Rau- 
schen oder Signale mit einer Frequenzabtastung wie- 30 
dergtbt 

In einer Multipliziereinheit 27 wird das zeitspektrale 
Muster N(t,Q von dem A/D-Umsetzer 25 und die aus 
dem Speicher 28 gelesene Obertragungsfunktion H(f) 
eingegeben, und die Multipliziereinheit (27) berechnet 35 
ein erstes zeitspektrales Gerauschmuster Ni(tJ) ent- 
sprechend der folgenden Formel: 

N.(t,0~N(tf)x H(f). 

40 

Das erste zeitspektrale Gerauschmuster Ni(tfl ent- 
spricht einem zeitspektralen Muster eines KJangs, wel- 
cher von dem Mikrophon 1 aufgenommen wird, wenn 
der Lautsprecher 2 einen KJang mit dem zeitspektralen 
Muster N(U) abgibt 45 

Die erste Gerausche-Subtrahiereinheit 30 erhalt das 
von der ersten Kennzeichen-Extrahiereinheit 10 abge- 
gebene zeitspektrale Muster X(Uf) und das erste, von 
der zweiten Kennzeichen-Extrahiereinheit 20 abgege- 
bene, zeitspektrale Gerauschmuster Ni(t,f) und subtra- 50 
hiert das erste zeitspektrale Gerauschmuster Ni(tf) von 
dem zeitspektralen Muster X(t,f). Daher erzeugt die er- 
ste Gerausche-Subtrahiereinheit 30 ein zeitspektrales 
Muster Xi(t.f) entsprechend der nachstehenden Formel 

55 

X,(t.f)»X(t/)-Ni(t^). 

Wie vorstehend bereits beschrieben worden ist, ent- 
spricht das zeitspektrale Muster Xi(tJ) einem Signal, 
welches erhalten wird, indem das Gerausch, welches auf 60 
dem wiederzugebenden Signal basiert, welches durch 
den Lautsprecher 2 in den KJang umgewandelt werden 
soil, von dem akustischen Signal subtrahiert wird, das 
von dem Mikrophon 1 erhalten wird. Die Sprachinter- 
vall-Detekttonseinheit 40 ermittelt die Sprachintervalle $5 
auf der Basis der zeitspektralen Muster Xt(tf), welche 
von der ersten Gerausche-Subtrahiereinheit abgegeben 
worden sind. Die Sprachintervall-Detektionseinheit 40 
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ermittelt die Sprachintervalle wie folgt: 

In jedem Rahmen fur eine Abtastzeit (beispielsweise 
10 ms) werden die zeitspektralen Muster Xi(tf) in alien 
(funfzehn) Frequenzbandern so addiert, daB die folgen- 
5 de Gesamtsumme erhalten wird: 



^> x 1 (f,t) 

f=l 

Wenn die Gesamtsumme grdBer als ein vorherbe- 
stimmter Schwellenwert ist, wird der Rahmen als das 
15 Sprachintervall festgelegt 

Die Gerausche-Vermutungseinheit 50 nimmt fortlau- 
fend das Mittel der zeitspektralen Muster Xi n (t,f), wel- 
che von der ersten Gerausche-Subtrahiereinheit 30 ab- 
gegeben werden, in Intervallen auBer dem Sprachinter- 
vall, das von der Sprachintervall-Detektionseinheit 40 
ermittelt worden ist. In den vorstehend angefQhrten 
Mustern X ln (tf) sind mit n die Intervalle auBer den 
Sprachintervallen (d h. keine Sprache enthaltende In- 
tervalle bzw. Nicht-Sprachen-Intervalle) bezeichnet 
Die Gerausche-Vermutungseinheit 50 gibt das Mittel 
der zeitspektralen Muster Xi n (tJ) als ein zweites zeit- 
spektrales Gerauschmuster Njfcf) ab. Das zweite zeit- 
spektrale Gerauschmuster N^t,Q entspricht inneren 
Gerauschen und nicht dem von dem Lautsprecher 2 
abgegebenen Klang. Das heiBt, das zweite zeitspektrale 
Gerauschmuster N^tf) entspricht einem Motorger- 
ausch, einem StraBengerausch u. a-, welches hauptsach- 
lich regelmaBige Gerausche sind, in welchen sich Qber 
einen entsprechenden Zeitabschnitt beztlglich der Zeit 
nicht viel andert Die zweite Gerausche-Subtrahierein- 
heit 60 subtrahiert das zweite zeitspektrale Gerausch- 
muster N2(t t f) von den zeitspektralen Mustern Xi$(t,f), 
welche von der ersten Gerausche-Subtrahiereinheit 30 
mittels der in der Sprachintervall-Detektionseinheit 40 
ermittelten Sprachintervalle abgegeben werden, so daB 
die zweite Gerausche-Subtrahiereinheit 60 die folgen- 
den zeitspektralen Muster S(tf) abgibt, welche der Stim- 
me des Sprechers entsprechen: 

SftO-XuftQ-Niftl). 

In dem vorstehenden Term Xjs(U) ist mit s das Zeit- 
sprachintervall bezeichnet Die Sprachintervall-Detek- 
tionseinheit 40, die Gerausche-Vermutungseinheit 50 
und die zweite Gerausche-Subtrahiereinheit 60 arbeiten 
entsprechend der herkommlichen "spektralen Subtrak- 
tionsmethode". 

Die Eingangsmuster-Erzeugungseinheit 70 wandelt 
die Kennzeichen, welche durch die zeitspektralen Mu- 
ster S(tfl festgesetzt worden sind, welche von der zwei- 
ten Gerausche-Subtrahiereinheit 60 geliefert worden 
sind, in ein eingegebenes Sprachmuster entsprechend 
einem bekannten BTSP-(Binary Time Spectrum Pat- 
tern-)Spracherkennungsverfahren urn. Das BTSP- 
Spracherkennungsverfahren ist beispielsweise in "Fuzzy 
Sets and Systems 32 (1989), Stn, 181 bis 191" (siehe 1989, 
Elsevier Science Publishers B.V., North-Holland) be- 
schrieben. Der Referenzmusterspeicher 80 speichert die 
Referenzmuster. Jedes der Referenzmuster hat ein For- 
mat, das auf dem BTSP-Spracherkennungsverfahren 
basiert Die Erkennungseinheit 90 gibt das eingegebene 
Sprachmuster von der Eingabemuster-Erzeugungsein- 
heit 70 und die Referenzmuster von dem Referenzmu- 
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sterspeicher80 ein und fQhrt eine Erkennungsoperation 
auf der Basis des BTSP-Spracherkennungsverfahrens 
durch. 

Die Sprachintervall-Detektionseinheit 40, die Ge- 5 
rausche-Vermutungseinheit 50, die zweite Gerausche- 
Subtrahiereinheit 60, die Eingangsmuster-Erzeugungs- 
einheit 70 und die Erkennungseinheit 90 sind beispiels- 
weise in einem Mikrocomputer ausgebitdet AuBerdem 
konnen die Methode, die Sprachintervalle in der 
Sprachintervall-Detektionseinheit 40 zu detektieren, die 
Methode, das Ger3usch in der zweiten Gerausch-Sub- 
trahiereinheit 60 zu subtrahieren, das Verfahren, das 
eingegebene Sprachmuster in der Eingangsmuster-Er- 
zeugungseinheit 70, das Format des in dem Referenz- ^ 
musterspeicher 80 gespeicherten Musters und eine Er- 
kennungsoperation in der Erkennungseinheit 90 zu er- 
zeugen, in solche Verfahren abgeandert werden, welche 
auf dem Gebiet der Spracherkennung bekannt sind. Ei- 
ne digitale Signalfunktionsschaltung, wie eine schnelie ^ 
Fourier-Transformation (FFT), kann an die Stelle von 
jeder der BandpaB-Filterbanke 13 und 23 gesetzt wer- 
den. Die ersten und zweiten Kennzeichen-Extrahierein- 
heiten 10 bzw. 20 haben die A/D-Umsetzer 15 und 25; 
die ersten und zweiten Kennzeichen-Extrahiereinheiten 
kSnnen jedoch auch statt dessen einen A/D-Umsetzer 
durch eine Time-Sharing-Steuerung gemeinsam benut- 
zen. 

Nunmehr wird eine Modifikation der ersten Ausfiih- 
rungsform anhand von Fig, 2 beschrieben. Fig. 2 zeigt 3Q 
das Spracherkennungssystem, urn eine Sprache (Stim- 
me) eines Sprechers unter einer Voraussetzung zu er- 
kennen, bei welcher zwei Lautsprecher in dem Fahr- 
zeug Klange abgeben. In Fig. 2 sind die Teile, welche 
dieselben sind wie die in Fig. 1 dargestellten Teile mit 
denselben Bezugszeichen bezeichnet 

In Fig. 2 wird ein erstes wiederzugebendes Signal ei- 
nem ersten Lautsprecher 2a und ein zweites wiederzu- 
gebendes Signal einem zweiten Lautsprecher 2b zuge- 
fuhrt Das erste wiederzugebende Signal wird auch an ^ 
eine zweite Kennzeichen-Extrahiereinheit 20a angelegt 
und das zweite wiederzugebende Signal wird auch an 
eine andere, zweite Kennzeichen-Extrahiereinheit 20b 
angelegt Das heiBt, in diesem Spracherkennungssystem 
sind zwei zweite Kennzeichen-Extrahiereinheiten 20a ^ 5 
und 20b vorgesehen. Eine zweite Kennzeichen-Extra- 
hiereinheit 20a hat eine Vorverzerrerschaltung 22a, eine 
BandpaB-RIterbank 23a, einen Multiplexer 24a und ei- 
nen A/D-Umsetzer 25a in derselben Weise wie in Fig. 1 
dargestellt ist Die andere, zweite Kennzeichen-Extra- 
hiereinheit 20b hat eine Vorverzerrerschaltung 22b, ei- 
ne BandpaB-Filterbank 23b, einen Multiplexer 24b und 
einen A/D-Umsetzer 25b in derselben Weise, wie in 
Fig. 1 dargestellt ist Ein Speicher 28a speichert eine 
erste Obertragungsfunktion H a (f) zwischen dem ersten 55 
Lautsprecher 2a und dem Mikrophon 1. Die erste Ober- 
tragungsfunktion H a (f) zeigt einen Zustand an, bei wel- 
chem der von dem ersten Lautsprecher 2a abgegebene 
Klang sich zu dem Mikrophon 1 hin ausbreitet. Das 
heiflt, die erste Obertragungsfunktion H»(f) gibt eine ^ 
Beziehung zwischen einem von dem ersten Lautspre- 
cher 2a abgegebenen Klang und einem an dem Mikro- 
phon 1 ankommenden KJang wieder und §ndert sich 
aufgrund der Bedingungen in einem Raum, welcher den 
ersten Lautsprecher 2a und das Mikrophon 1 umgibt 
Die erste Obertragungsfunktion H a (f) kann auch experi- 
ment ell in derselben Weise wie in dem anhand von 
Fig. 1 beschriebenen Fall erhalten werden. Ein Speicher 
28b in der anderen zweiten Kennzeichen-Extrahierein- 
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heit 20b speichert eine zweite Obertragungsfunktion 
Hb(f) zwischen dem zweiten Lautsprecher 2b und dem 
Mikrophon 1. Die zweite Obertragungsfunktion Hb(Q 
gibt einen Zustand wieder, unter welchem sich der von 
dem zweiten Lautsprecher 2b abgegebene KJang zu 
dem Mikrophon 1 hin ausbreitet bzw. fortpflanzt Das 
heiBt, die zweite Obertragungsfunktion HbffJ gibt eine 
Beziehung zwischen einem von dem zweiten Lautspre- 
cher 2a abgegebenen Klang und einem an dem Mikro- 
phon t ankommenden Klang wieder und andert sich 
aufgrund des Zustandes bzw. der Voraussetzungen in 
einem Raum, welcher den zweiten Lautsprecher 2b und 
das Mikrophon 1 umgibt Die zweite Obertragungs- 
funktion Hb(f) kann auch auf dieselbe Weise wie in dem 
unter Bezugnahme auf Fig. 1 beschriebenen Fall experi- 
mentell erhalten werden. 

In der zweiten Kennzeichen-Extrahiereinheit 20a 
wird ein zeitspektrales Muster N a (t,f) des ersten wieder- 
zugebenden Signals erhalten, und dann multipliziert ei- 
ne Multipliziereinheit 27a das zeitspektrale Muster 
N a (tf) und die erste Obertragungsfunktion Ha(f)r so daB 
dann die Multipliziereinheit 27a abgibt: N a (tf) x Ha(Q. In 
der anderea zweiten Kennzeichen-Extrahiereinheit 20b 
wird ein zeitspektrales Muster Nb(tf) des zweiten wie- 
derzugebenden Signals erhalten, und dann multipliziert 
eine Multipliziereinheit 27b die zeitspektralen Muster 
Nb(tJ) und die zweite Obertragungsfunktion Hb(f), so 
daB dann die Multipliziereinheit 27b abgibt: 
Nb(tO x Hb(f). Ein Addierer 29 erhalt N a (t,f) x H a (f) von 
der Multipliziereinheit 27a und Nb(t,f) x Hb(f) von der 
Multipliziereinheit 27b und gibt das folgende, zeitspek- 
trale Gerauschmuster Ni(tf) ab: 

Ni(tJ) - N»(U) x H a (f) + Nb(U) x Hb(0. 

Der SpracherkennungsprozeB wird dann auf der Ba- 
sis des zeitspektralen Musters X(tf), das von der ersten 
Kennzeichen-Extrahiereinheit 10 abgegeben worden 
ist, auf der Basis des zeitspektralen Gerauschmusters 
Ni(t,f), das von dem Addierer 29 abgegeben worden ist, 
und der Referenzmuster aus dem Speicher 80 in dersel- 
ben Weise wie bei dem vorstehend anhand von Fig. 1 
beschriebenen ProzeB durchgefuhrt 

Das in Fig. 2 dargestellte Spracherkennungssystem 
wird in dem Fall angewendet, wenn zwei Lautsprecher 
2a und 2b im Inneren des Fahrzeugs vorgesehen sind. 
Selbst wenn die Anzahl von im Inneren des Fahrzeugs 
vorgesehener Lautsprecher grdBer als zwei ist kann 
jedoch das Spracherkennungssystem in derselben Wei- 
se wie in Fig. 2 dargestellt ist, realisiert werden. Das 
heiBt eine zweite Kennzeichen-Extrahiereinheit, eine 
Multipliziereinheit und einen Obertragungsfunktions- 
speicher, welcher jedem der Lautsprecher entspricht 
sind vorgegeben und Ausgangssignale von den ver- 
schiedenen zweiten Kennzeichen-Extrahiereinheiten 
werden so addiert, daB das zeitspektrale Gerauschmu- 
ster Ni(tf) erhalten wird. 

Nunmehr wird eine zweite Ausfilhrungsform mit 
Merkmalen nach der Erfindung anhand von Fig. 3 be- 
schrieben. Die Obertragungsfunktion H(f) zwischen 
dem Lautsprecher 2 und dem Mikrophon 1 findert sich 
aufgrund des Zustands bzw. der Voraussetzungen eines 
Raums, welcher den Lautsprecher 2 und das Mikrophon 
1 umgibt Menschliche K6rper absorbieren eine akusti- 
sche Welle, so daB sich beispielsweise in dem Fahrzeug 
die Obertragungsfunktion H(f) in Abhangigkeit von der 
Anzahl der Personen im Inneren des Fahrzeugs andert 
Die Obertragungsfunktion H(f) andert sich auch in Zu- 
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sammenhang mit der Anzahl geoffneter Tiiren und/oder und 20b ( welche den jeweiligen Lautsprechern 2a und 2b 

Fenster in dem Fahrzeug. Daher werden in der zweiten in derselben Weise wie diejenigen in Fig. 2 entsprechen. 

AusfQhrungsform eine Anzahl Obertragungsfunkdonen In jeder der zweiten KLennzeichen-Extrahiereinheiten 

in dem Obertragungsfunktions-Speicher gespeichert, 20a und 20b werden eine Anzahl Obertragungsfunktio- 

wobei jede der Obertragungsfunktionen der Anzahl 5 nen Hr(f) in dem jeweiligen Obertragungsfunktions- 

Personen oder der Anzahl geoffneter Turen und/oder Speicher 28a und 28b in derselben Weise wie in dem 

Fenster in dem Fahrzeug entspricht anhand von Fig. 2 beschriebenen Spracherkennungssy- 

In Fig. 3 sind die Teile, welche dieselben wie diejeni- stem gespeichert. Dann wahlt der Wahlschaiter 28' eine 

gen in Fig. 1 sind, mit denselben Bezugszeichen bezeich- der in dem jeweiligen Speicher 28a und 28b gespeicher- 

net In Fig. 3 werden eine Anzahl Obertragungsfunktio- "> ten Obertragungsfunktionen in derselben Weise aus, 

nen Hr(U) vorher in dem Obertragungsfunktions-Spei- wie in Fig. 3 dargestellt und anhand von Kg. 3 beschrie- 

cher 28 gespeichert In den Funktionen Ht(tJ) ist mit r ben ist 

ein bestimmter Typ der Obertragungsfunktionen H(tf) Die Obertragungsfunktion andert sich in Abhangig- 

bezeichnet Beispielsweise wird dann, wenn die Anzahl keit von einem Zustand, ob namlich jede der TQren 

Personen im Inneren des Fahrzeugs gleich r (r =* 1, 2, is und/oder Fenster des Fahrzeugs gedffnet oder ge- 

. . .) ist, die Obertragungsfunktion mit Hr(f) bezeichnet schlossen ist In diesem Fall werden eine Anzahl Ober- 

Jede der Obertragungsfunkdonen Hi<f) wird experi- tragungsfunktionen Hr<f) vorher in dem in Fig. 3 darge- 

mentell unter der Voraussetzung erhalten, bei welcher r stellten Speicher 28 oder in jedem der in Fig. 4 darge- 

Personen in einem Fahrzeug sitzea Beispielsweise wird stellten Speicher 28a und 28b gespeichert Beispielswei- 

jede der Obertragungsfunktionen Hr{f) auf der Basis des 20 se gibt es verschiedene Zustande, daB namlich jede der 

Impuls-Frequenzbereichs zwischen dem Lautsprecher 2 TQren des Fahrzeugs entweder gedffnet oder geschlos- 

und dem Mikrophon 1 unter der Voraussetzung erhal- sen ist Wenn das Fahrzeug V vier TQren Dl bis D4 hat, 

ten, daB r Personen in dem Fahrzeug sitzea wie in Fig. 5 dargestellt ist, gibt es 16 (2*) Zustande» da 

Ein Wahlschaiter (Wahleinheit) 28' ist zum Auswah- jede der Turen Dl bis D4 entweder geoffnet oder ge- 

len einer der Obertragungsfunktionen Hi{f) vorgesehen. 25 schlossen sein kann. Folglich entspricht jede der Ober- 

Der Wahlschaiter 28' hat eine Anzahl von Schaltele- tragungsfunktionen Hi(r) dem r-ten Zustand der TQren 

menten, welche jeweils der Anzahl Personen in dem (r=l, 2, ... 16). Jede der Obertragungsfunktionen Hi{f) 

Fahrzeug entsprechen. Wenn beispielsweise r Personen wird beispielweise auf der Basis des Impuls-Frequenz- 

in dem Fahrzeug sitzen, kann der Fahrer des Fahrzeugs verlaufs zwischen jedem Lautsprecher und dem Mikro- 

ein Schalterelement betatigen, das r Personen ent- 30 phon 1 in dem r-ten Zustand der TQren erhalten. 

spricht Infolge der Betatigung des r Personen entspre- In diesem Fall sind in dem Fahrzeug V, wie in Fig. 5 

chenden Schaltelements in dem Wahlschaiter 28' wird dargestellt ist, vier Schalter SWt bis SW4 vorgesehen, 

die Obertragungsfunktion Hr(Q aus dem Speicher 28 um festzustellen ob verschiedene TQren Dl bis D4 ge- 

ausgelesen und der Multipliziereinheit 27 zugefuhrt Die offnet sind oder nicht Jeder der Schalter SW1 bis SW4 

Multipliziereinheit 27 berechnet dann das folgende zeit- 35 wird automatisch angeschaltet wenn eine der entspre- 

spektrale Gerauschmuster Ni(t,f). chtnden TQren Dl bis D4 geschlossen ist Ein-/Aus-Si- 

gnale, welche von den Schaltern SW1 bis SW4 abgege- 

Ni(U) « N(t0 x Hr<0. ben werden, werden einer Steuereinheit 100 zugefGhrt 

Die Steuereinheit 100 hat Zugriff zu dem Speicher 28 

Folglich wird dieses zeitspektrale Gerauschmuster 40 U nd wahlt eine Obertragungsfunktion H (0 aus, welche 

Ni(t,f) von der zweiten Kenrtzeichen-Extrahiereinheit dem r-ten Zustand der Turen entspricht, welcher durch 

20abgegeben. die Ein-/Aus-Signale spezifiziert ist, welche durch die 

Dann werden die Spracherkennungsprozesse auf der Schalter SW1 bis SW4 geliefert worden sind Die ausge- 

Basis des zeitspektralen Musters X(tJ), das von der er- wahlte Obertragungsfunktion Hi(f) wird an die Multipli- 

sten Kennzeichen-Extrahiereinheit 10 abgegeben wor- 45 ziereinheit 27 angetegt, welche dann das folgende zeit- 

den ist, auf der Basis des zeitspektralen Gertuschmu- spektrale Gerauschmuster Ni(tQ in derselben Weise 

sters Ni(t,fX das von der zweiten Kennzeichen- Extra- wie in Fig. 1 dargestellt ist, berechnet namlich: 
hiereinheit 20 abgegeben worden ist, und auf der Basis 

des von dem Speicher 80 abgegebenen Referenzmu- Ni(tJ) — X(tf) x Hi{f). 

sters in derselben Weise wie die anhand von Fig. 1 be- 50 

schriebenen Prozesse durchgefuhrt Es kann auch eine Obertragungsfunktion zwischen 

Bei der zweiten AusfQhrungsform kann die Obertra- dem Lautsprecher und dem Mikrophon entsprechend 

gungsfunktion entsprechend der Anzahl Personen, wel- verschiedenen Zustanden bestimmt werden, je nachdem 

che in dem Fahrzeug sitzen, ausge wahlt werden, so daB welches der Fenster des Fahrzeugs gedffnet oder ge- 

absolut sicher das Gerdusch von dem Lautsprecher 2 55 schlossen ist AuBerdem kann die Obertragungsfunktion 

von dem Gerausch an dem Mikrophon 1 bzw. das von zwischen dem Lautsprecher und dem Mikrophon in 

dem Mikrophon 1 aufgenommen worden ist, subtrahiert Obereinstimmung damit bestimmt werden, wie viele der 

wird, selbst wenn sich die Anzahl Personen im Inneren verschiedenen Fenster, die in dem Fahrzeug vorgesehen 

des Fahrzeugs andert sind, gedffnet sind. In diesem Fall ist eine FQhleinrich- 

Nunmehr werden verschiedene Modifikationen der 60 rung, um festzustellen, wie viele der Fenster jeweils ge- 

zweiten AusfQhrungsform anhand von Fig. 4 bis 6 be- offnet sind, in dem Spracherkennungssystem vorgese- 

schrieben. In Fig. 4 ist ein Spracherkennungssystem hen, wie in Fig. 6 dargestellt ist 

dargestellt, bei welchem zwei Lautsprecher 2a und 2b In Fig. 6 hat eine FQhleinheit 40a einen Schiebewider- 

im Inneren des Fahrzeugs vorgesehen sind. In Fig. 4 stand R, welcher an einem Rahmen 41 jedes Fensters 

sind die Teile, welche dieselben sind wie die in Fig. 2 und 65 WD vorgesehen ist, eine Gleichstromquelle Vo und ein 

3 dargestellten Teile mit denselben Bezugszeichen be- Amperemeter 42. Das Fenster WD kann in dem Rah- 

zeichnet In diesem Fall hat das Spracherkennungssy- men auf- und abwarts bewegt werden. Der Wert des 

stem zwei zweite Kennzetchen-Extrahiereinheiten 20a Schiebewiderstands R wird entsprechend der GrdBe 



DE 41 06 

11 



der Kante des Fensters WD geandert, die mit dem 
Schiebewiderstand R in Kontakt steht Die Gleich- 
stromquelle Vo, der Schiebewiderstand R und das Am- 
peremeter 42 sind in Reihe geschaltet, so daB der Wert 
des Schiebwiderstand R fiber das Amperemeter 42 er- 
mittelt wird Das heiBt, ein Ausgangssignal von dem 
Amperemeter 42 gibt wieder, wie weit jedes Fenster 
WD gedffnet ist Das Ausgangssignal von dem Ampere- 
meter 42 wird der Steuereinheit 100 zugefuhrt, welche 
wiederum die Obertragungsfunktion auswahlt, welche 
einem Ausgangssignal entspricht, das von jeder Fuhlein- 
heit 40a geliefert worden ist, die an jedem der Fenster 
des Fahrzeugs vorgesehen ist 

Um zu verhindern, daB die Anzahl an Obertragungs- 
funktionen zunimmt, ist es wunschenswert, daB die Off- 
nungsweite jedes Fensters WD in zwei oder drei Stufen 
eingeteilt wird. Beispielsweise ist in der ersten Stufe 
jedes Fenster geschlossen oder befindet sich in einem 
Zustand zwischen dem geschlossenen Zustand und ei- 
nem Zustand, in welchem es zu einem Drittel geoffnet 
ist. In der zweiten Stufe befindet sich jedes Fenster in 
dem Zustand, daB es zu einem Drittel geoffnet ist, oder 
weist einen Zustand zwischen dem Zustand, in welchem 
es zu einem Drittel gedffnet ist, und einem Zustand, in 
welchem es zu zwei Drittel gedffnet ist. In einer dritten 
Stufe nimmt jedes Fenster einen Zustand ein, in wel- 
chem es zu zwei Drittel gedffnet ist, oder es ist volistan- 
dig gedffnet oder nimmt einen Zustand zwischen dem 
Zustand, in welchem es zu zwei Drittel gedffnet ist und 
dem vollstandig gedffneten Zustand ein. Wenn in die- 
sem Fall vier Fenster in dem Fahrzeug vorgesehen sind, 
haben die Fenster 81 (3 4 ) Zustande. Jede Obertragungs- 
funktion, welche jedem der 81 Zustande der Fenster 
entspricht, ist dann in dem Obertragungsfunktions-Spei- 
cher 28 vorgesehen, 

Wieweit jedes Fenster gedffnet ist, kann auch roit 
Hilfe optischer Sensoren festgestellt werden. AuBerdem 
kann die Obertragungsfunktion auf der Basis einer 
Kombination von zwei oder mehr der folgenden Fakto- 
ren bestimmt werden: die Anzahl Personen im Inneren 
des Fahrzeugs, die Anordnung der Personen im Inneren 
des Fahrzeugs, ob jede TUr gedffnet oder geschlossen 
ist, und wie weit jedes Fenster gedffnet ist 

GemaB der Erfindung kann das GerSusch von dem 
Lautsprecher von dem KJang, welcher dem Mikrophon 
zugefuhrt bzw. von diesem aufgenommen wird, mit Hil- 
fe der Obertragungskenndaten, wie der Obertragungs- 
funktion zwischen Lautsprecher und dem Mikrophon, 
subtrahiert werden. Somit kann ohne weiteres das Ge- 
rausch gegenfiber dem akustischen Signal unterdruckt 
werden. 

Patentanspruche 

1. GerauschunterdrQckungseinrichtung fur ein 
Spracherkennungssystem, in welchem eine Sprache 
eines Sprechers, welche einem Mikrophon (1) zuge- 
fQhrt worden ist, erkannt werden kann, wobei das 
Mikrophon in einem Raum vorgesehen ist, in dem 
sich ein Lautsprecher (2) befindet, welcher einen 
KJang abgibt, der einem wiederzugebenden Signal 
entspricht, welches von einer Audio- Einheit zuge- 
fuhrt wird, mit einer ersten Kennzeichen-Extrahier- 
einheit (10), um erste Kennzeichendaten aus einem 
elektrischen Signal zu extrahieren, das von dem 
Mikrophon (1) abgegeben worden ist, wobei die 
ersten Kennzeichendaten ein Kennzeichen des 
elektrischen Signals darstellen; mit einer zweiten 



405 C2 

12 

ICennzeichen-Extrahiereinheit (20X um zweite 
Kennzeichendaten aus dem wiederzugebenden Si- 
gnal zu extrahieren, welches dem Lautsprecher (2) 
zugefuhrt werden soil wobei die zweiten Kennzei- 
chendaten ein Kennzeichen des wiederzugebenden 
Signals darstellen, mit einer ersten Gerauschkom- 
ponenten erzeugenden Einheit, welche mit der 
zweiten Kennzeichen-Extrahiereinheit (20) verbun- 
den ist, um Gerauschdaten, welche auf den zweiten 
Kennzeichendaten von der zweiten Kennzeichen- 
Extrahiereinheit (20) beruhen, zu erzeugen, wobei 
die Gerauschdaten einen Klang darstellen, welcher 
sich von dem Lautsprecher (2) durch den Raum zu 
dem Mikrophon (1) fortpflanzt, und mit einer ersten 
Gerausche-Subtrahiereinheit (30), welche mit der 
ersten Kennzeichen-Extrahiereinheit (10) und der 
ersten Gerauschkomponenten erzeugenden Ein- 
heit verbunden ist, um die Gerauschdaten, welche 
von der ersten Gerauschkomponenten erzeugen- 
den Einheit zugefuhrt worden sind, von den ersten 
Kennzeichendaten zu subtrahieren, die von der er- 
sten Kennzeichen-Extrahiereinheit (10) zugefuhrt 
worden sind, und um erste Sprachdaten abzugeben, 
so daB die ersten Sprachdaten verwendet werden, 
um die Sprache des Sprechers zu erkennen, da- 
durch gekennzeichnet, daB ein Speicher (28) zum 
Speichern von Obertragungskenndaten vorgese- 
hen ist, welche einen Zustand darstellen, unter wel- 
chem sich ein Klang von dem Lautsprecher (2) zu 
dem Mikrophon (1) ausbreitet, wobei die Obertra- 
gungskenndaten vorher in dem Raum gemessen 
worden sind, in welchem das Mikrophon (1) und der 
Lautsprecher (2) vorgesehen werden, und daB die 
erste Gerauschkomponenten erzeugende Einheit 
auch mit dem Speicher (28) verbunden ist, um Ge- 
rauschdaten, welche auf den zweiten Kennzeichen- 
daten von der zweiten Kennzeichen-Extrahierein- 
heit (20) und den Obertragungskenndaten von dem 
Speicher (28) beruhen, zu erzeugen. 

2. Einrichtung nach Anspruch 1, dadurch gekenn- 
zeichnet, daB die Obertragungskenndaten eine 
Obertragungsfunktion zwischen dem Lautsprecher 

g) und dem Mikrophon (1) angeben, wobei die 
bertragungsfunktion eine Beziehung zwischen ei- 
nem Klang, welcher von dem Lautsprecher (2) ab- 
gegeben wird, und einem Klang darstellt, welcher 
von dem Lautsprecher (2) dem Mikrophon (I) zu- 
gefuhrt wird. 

3. Einrichtung nach Anspruch 1, dadurch gekenn- 
zeichnet, daB die erste Gerauschkomponenten er- 
zeugende Einheit eine MuJtipliziereinheit (27) auf- 
weist, welche die zweiten Kennzeichendaten und 
die Obertragungsfunktion miteinander multipli- 
ziert, wobei das Multiplizierergebnis in der Multi- 
pliziereinheit (27) als die Gerauschdaten verwendet 
werden. 

4. Einrichtung nach Anspruch 1, dadurch gekenn- 
zeichnet, daB der Speicher (28) eine Anzahl Ober- 
tragungskenndaten speichert, welche jeweils einem 
Zustand des Raumes entsprechen, in welchem der 
Lautsprecher (2) und das Mikrophon (1) vorgese- 
hen sind, und daB eine Wahleinheit (28*) vorgese- 
hen ist, um eine der Obertragungskenndaten aus 
dem Speicher (28) entsprechend einem Zustand des 
Raumes auszuwahlen, in welchem der Lautspre- 
cher (2) und das Milg-ophon (I) vorhanden sind, so 
daB die ausgewahlten Obertragungskenndaten der 
ersten Gerauschkomponenten erzeugenden Ein- 
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heit zugefQhrt werden. 

5. Etnrichtung nach einem der Anspruche 1 bis 4, 
dadurch gekennzeichnet, daB das Mikrophon (1) im 
Inneren eines Fahrzeugs vorgesehen ist, in wel- 
chem der Lautsprecher (2) vorgesehen ist, und daB 5 
jede der Obertragungskenndaten auf der Basis der 
Anzahl Personen im Inneren des Fahrzeugs be- 
stiramt wird, und daB die Wahleinheit (28') die 
Obertragungskenndaten auswahlt, welche der An- 
zahl Personen im Inneren des Fahrzeugs entspre- 10 
chen. 

6. Einrichtung nach Anspruch 5, dadurch gekenn- 
zeichnet, daB Obertragungskenndaten jeweils in 
Abhangigkeit davon bestimmt werden, ob jede Tur 
des Fahrzeugs gedffnet oder geschlossen ist, und 15 
daB die Wfihleinheit (28') diejenigen Obertragungs- 
kenndaten auswahlt, welche dem Zustand entspre- 
chen, bei welchem die Turen des Fahrzeugs geoff- 
net oder geschlossen sind 

7. Einrichtung nach Anspruch 6, dadurch gekenn- 20 
zeichnet, daB die Wahleinheit (280 FOhleinheiten 
(SW1 bis SW4; 100) aufweist, urn festzustellen, ob 
jede Tur des Fahrzeugs gedffnet ist oder nicht, so 
daB die jeweilige Obertragungscharakteristik auf 
der Basis eines Ffihlergebnisses in der FQhleinheit 25 
(SW1 bis SW4; 100) gewShlt wird. 

8. Einrichtung nach Anspruch 4, dadurch gekenn- 
zeichnet, daB Obertragungskenndaten jeweils in 
Abhangigkeit davon bestimmt werden, wie weit je- 
des Fenster (WD) des Fahrzeugs gedffnet ist, und 30 
daB die Wahleinheit (28') die jeweiligen Obertra- 
gungskenndaten in Abhangigkeit davon auswahlt, 
wie weit jedes Fenster des Fahrzeugs gedffnet ist. 

9. Einrichtung nach Anspruch 8, dadurch gekenn- 
zeichnet, daB die Wahleinheit (28') eine Fflhleinheit 33 
(40a) hat, urn festzustellen, wie weit jedes Fenster 
des Fahrzeugs gedffnet ist, so daB eine Obertra- 
gungscharakteristik in Abhangigkeit davon ge- 
wahlt wird, wie weit jedes Fenster gedffnet ist. 

10. Einrichtung nach Anspruch 1, gekennzeichnet 
durch eine zweite Gerauschkomponenten erzeu- 
gende Einheit (40, 50% welche mit der ersten Ge- 
rausche-Subtrahiereinheit (30) verbunden ist, urn 
eine Gerauschkomponente auf der Basis der ersten 
Sprachdaten zu erzeugen, und eine zweite Ge- 45 
rausche-Subtrahiereinheit (60), urn die Gerausch- 
komponente, welche von der zweiten Gerausch- 
komponenten erzeugenden Einheit (40, 50) erzeugt 
worden ist, von den ersten Sprachdaten zu subtra- 
hieren, welche von der ersten Gerausche-Subtra- 50 
hiereinheit (30) zugefOhrt worden sind, wobei die 
zweite Gerausche-Subtrahiereinheit (60) zweite 
Sprachdaten abgibt, so daB die zweiten Sprachda- 
ten zum Erkennen der Sprache/Stimme des Spre- 
chers verwendet werden. sa 

1 1. Einrichtung nach einem der Anspruche 1 bis 10, 
dadurch gekennzeichnet, daB in dem Raum mehre- 
re Lautsprecher (2a, 2b) mit einem Mikrophon (1) 
kombiniert angeordnet sind und daB Speicher (28a, 
28b) zum Speichern von Obertragungskenndaten 60 
ausgebildet sind, welche einen Zustand darstellen, 
bei welchem ein KJang sich von jedem der Laut- 
sprecher (2a, 2b) zu dem Mikrophon (1) fortpflanzt, 
wobei die Obertragungskenndaten vorher in dem 
Raum gemessen worden sind, in welchem das Mi- 65 
krophon (1) und die Lautsprecher (2a, 2b) angeord- 
net sind. 

12. Einrichtung nach Anspruch 1 1, dadurch gekenn- 
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zeichnet, daB die Obertragungskenndaten eine 
Obertragungsfunktion zwischen jedem der Laut- 
sprecher (2a, 2b) und dem Mikrophon (1) sind, wo- 
bei die Obertragungsfunktion eine Beziehung zwi- 
schen einem Klang, welcher von jedem der Laut- 
sprecher (2a, 2b) abgegeben wird, und einem Klang 
darstellen, welcher von jedem der Lautsprecher 
(2a, 2b) dem Mikrophon (1) zugefOhrt wird. 

13. Einrichtung nach Anspruch 3, dadurch gekenn- 
zeichnet, daB die Gerauschdaten erzeugende Ein- 
heit einen Addierer (29) aufweist, urn Gerausch- 
komponenten, welche von der ersten Gerausch- 
komponenten erzeugenden Einheit zugefQhrt wor- 
den sind, zu addieren, wobei dann der Addierer (29) 
die Gerauschdaten abgibt. 

14. Einrichtung nach Anspruch 11, gekennzeichnet 
durch eine zweite Gerauschkomponenten erzeu- 
gende Einheit (40, 50^ welche mit der ersten Ge- 
rausche-Subtrahiereinheit (30) verbunden ist, urn 
eine Gerauschkomponente auf der Basis der ersten 
Sprachdaten zu erzeugen, und eine zweite Ge- 
rausche-Subtrahiereinheit (60) zum Subtrahieren 
der Gerauschkomponente, welche von der zweiten 
Gerauschkomponenten erzeugenden Einheit (40, 
50) erzeugt worden ist, von den ersten Sprachdaten 
zu subtrahieren, welche von der ersten Gerausche- 
Subtrahiereinheit (30) zugefOhrt worden sind, wo- 
bei die zweite Gerausche-Subtrahiereinheit (60) 
zweite Sprachdaten abgibt, so daB die zweiten 
Sprachdaten zum Erkennen der Sprache/Stimme 
des Sprechers verwendet werden. 
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